У нас есть Тошина разметка, что мы можем сказать интересного на ее основании? Там есть следующие названия столбцов:

##  [1] "Sign"                    "H1 FingerSelection"     
##  [3] "H1 Aperture"             "H1 Curve"               
##  [5] "H1 Bent"                 "H1 Facing"              
##  [7] "H1 Focus"                "H1 Width"               
##  [9] "Dynamic Orientation"     "Location"               
## [11] "Plane"                   "Settings"               
## [13] "Path"                    "H2 FingerSelection"     
## [15] "H2 Aperture"             "H2 Curve"               
## [17] "H2 Bent"                 "H2 Width"               
## [19] "H2 Facing"               "H2 Focus"               
## [21] "url"                     "file"                   
## [23] "labeled_url"             "iconic"                 
## [25] "Anna_Klezovich_comments" "segment"                
## [27] "manner_tense"            "manner_repeated"        
## [29] "manner_laceration"       "manner_symmetrical"     
## [31] "manner_alternating"      "manner_biderectional"   
## [33] "label"

Я хочу найти аутлайеров как среди точек, так и среди наблюдаемых значений. Построю MCA:

Вот точки:

Meaning

Индексы I и II – это разные слова. Числа обозначают номер сегмента.

H1.FingerSelection

## Warning: Removed 6 rows containing missing values (geom_path).

H1.Aperture

H1.Curve

H1.Bent

H1.Facing

H1.Focus

H1.Width

Dynamic.Orientation

## Warning: Removed 4 rows containing missing values (geom_path).

Location

## Warning in MASS::cov.trob(data[, vars]): Probable convergence failure
## Warning: Removed 3 rows containing missing values (geom_path).

Plane

Settings

## Warning in MASS::cov.trob(data[, vars]): Probable convergence failure
## Warning: Removed 36 rows containing missing values (geom_path).

Path

## Warning in MASS::cov.trob(data[, vars]): Probable convergence failure
## Warning: Removed 2 rows containing missing values (geom_path).

H2.FingerSelection

## Warning: Removed 3 rows containing missing values (geom_path).

H2.Aperture

## Warning: Removed 1 rows containing missing values (geom_path).

H2.Curve

## Warning: Removed 1 rows containing missing values (geom_path).

H2.Bent

H2.Width

## Warning: Removed 1 rows containing missing values (geom_path).

H2.Facing

## Warning in MASS::cov.trob(data[, vars]): Probable convergence failure

H2.Focus

## Warning: Removed 1 rows containing missing values (geom_path).

manner_tense

manner_repeated

manner_laceration

manner_symmetrical

manner_alternating

manner_biderectional

manner_alternating

Что это за аутлайеры?

Вот переменные:

Чего-то справа торчат переменные, относящиеся к правой руке.

А вот все вместе:

Тошина модель

Насколько важны все узлы?

Давай-ка выделим автоматически двуручные жесты:

Видно, что чем ось 1 отвечает за количество двуручных признаков в жесте.

А вторая ось отвечает за необычные признаки первой руки:

Иконичность

Хотя большинство жестов оутлайеров все же иконичны, надо отметить, что в основном центральном кластере они представлены достаточно равномерно.